首页> 外文OA文献 >Implementasi Teknik Dynamic TIME Warping (Dtw) Pada Aplikasi Speech to Text
【2h】

Implementasi Teknik Dynamic TIME Warping (Dtw) Pada Aplikasi Speech to Text

机译:动态时间规整(Dtw)技术在语音到文本应用中的实现

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Suara/ucapan adalah salah satu cara kita sebagai manusia untuk berkomunikasi dan mengekspresikan diri. Speech to text (ucapan ke text), merupakan salah satu bidang sains computer yaitu bidang pengolahan suara. Speech to text (STT) adalah penerjemahan kalimat (kata yang diucapkan) ke dalam text. STT merupakan proses pengolahan suatu sinyal suara, mengekstrak fitur dari sinyal suara tersebut yang selanjutkan dibandingkan dengan hasil ekstraksi dari sinyal suara yang lain untuk dapat dikenali persamaannya. Penelitian ini merancang dan membangun suatu program aplikasi Speech to Text yang mampu identifikasi suatu sinyal suara menggunakan perangkat lunak simulasi MATLAB R2016a. Terdapat dua proses umum pada bidang pengolahan suara, yaitu ekstraksi fitur dan pencocokan fitur. Pada sistem ini metode mel-frequency cepstral coefficients digunakan untuk mengekstraksi fitur dan metode dynamic time warping digunakan untuk pencocokan fitur. Metode DTW yang digunakan dapat menghitung jarak atau selisih antara dua data yang dibandingkan. Rata-rata akurasi yang didapat setelah dilakukan percobaan pada pengujian kata adalah 95.85% dan pada pengujian kalimat adalah 94%.
机译:语音/语音是人类交流和表达自我的一种方式。语音到文本(语音到文本)是计算机科学的领域之一,它是声音处理领域。语音到文本(STT)是将句子(口语)翻译成文本。 STT是处理声音信号,从声音信号中提取特征的过程,然后将其与从其他声音信号中提取的结果进行比较,以通过公式进行识别。本研究设计并构建了“语音转文本”应用程序,该程序能够使用MATLAB R2016a仿真软件来识别声音信号。声音处理领域中有两个常见的过程,即特征提取和特征匹配。在该系统中,使用梅尔频率倒谱系数的方法提取特征,并使用动态时间规整方法进行特征匹配。使用的DTW方法可以计算要比较的两个数据之间的距离或差异。进行单词测试实验后获得的平均准确度为95.85%,而在句子测试中则为94%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号